On the Difficulty of Translating Free-Order Case-Marking Languages

نویسندگان

چکیده

Abstract Identifying factors that make certain languages harder to model than others is essential reach language equality in future Natural Language Processing technologies. Free-order case-marking languages, such as Russian, Latin, or Tamil, have proved more challenging fixed-order for the tasks of syntactic parsing and subject-verb agreement prediction. In this work, we investigate whether class also difficult translate by state-of-the-art Neural Machine Translation (NMT) models. Using a variety synthetic newly introduced translation challenge set, find word order flexibility source only leads very small loss NMT quality, even though core verb arguments become impossible disambiguate sentences without semantic cues. The latter issue indeed solved addition case marking. However, medium- low-resource settings, overall quality remains unmatched.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Translating into Free Word Order Languages

In this paper, I discuss machine translation of English text into a relatively “free” word order language, specifically Turkish. I present algorithms that use contextual information to determine what the topic and the focus of each sentence should be, in order to generate the contextually appropriate word orders in the target language.

متن کامل

the norms of localization in translating persian multimodal texts: the case of videogame demos

abstract هنجارهای بومی سازی در ترجمه متون چندوجهی فارسی:مورد دموهای بازیهای کامپیوتری چکیده اهداف عمده مطالعه حاضر به سه دسته تقسیم میشوند: 1) بررسی مشکلات احتمالی ترجمه دموهای (فیلمهای) بازیهای کامپیوتری،2) تعیین هنجارهای بومی سازی در ترجمه دموهای (فیلمهای) بازیهای کامپیوتری و 3) تعیین ایدئولوژیهایی که این هنجارها در جامعه نشان میدهند. به این منظور، ابتدا، مجموعه ای ازدموهای (فیلمهای) ب...

15 صفحه اول

the effect of traffic density on the accident externality from driving the case study of tehran

در این پژوهش به بررسی اثر افزایش ترافیک بر روی تعداد تصادفات پرداخته شده است. به این منظور 30 تقاطع در شهر تهران بطور تصادفی انتخاب گردید و تعداد تصادفات ماهیانه در این تقاطعات در طول سالهای 89-90 از سازمان کنترل ترافیک شهر تهران استخراج گردید و با استفاده از مدل داده های تابلویی و نرم افزار eviews مدل خطی و درجه دوم تخمین زده شد و در نهایت این نتیجه حاصل شد که تقاطعات پر ترافیک تر تعداد تصادفا...

15 صفحه اول

the effect of consciousness raising (c-r) on the reduction of translational errors: a case study

در دوره های آموزش ترجمه استادان بیشتر سعی دارند دانشجویان را با انواع متون آشنا سازند، درحالی که کمتر به خطاهای مکرر آنان در متن ترجمه شده می پردازند. اهمیت تحقیق حاضر مبنی بر ارتکاب مکرر خطاهای ترجمانی حتی بعد از گذراندن دوره های تخصصی ترجمه از سوی دانشجویان است. هدف از آن تاکید بر خطاهای رایج میان دانشجویان مترجمی و کاهش این خطاها با افزایش آگاهی و هوشیاری دانشجویان از بروز آنها است.از آنجا ک...

15 صفحه اول

the impact of training on second language writing assessment: a case of raters’ biasedness

چکیده هدف اول این تحقیق بررسی تأثیر آموزش مصحح بر آموزش گیرندگان براساس پایایی نمره های آنها در پنج بخش شامل محتوا ، سازمان ، لغت ، زبان و مکانیک بود. هدف دوم این بود که بدانیم آیا تفاوتهای بین آموزشی گیرندگان زن و مرد در پایایی نمرات آنها وجود دارد. برای بررسی این موارد ، ما 90 دانشجو در سطح میانه (متوسط) که از طریق تست تعیین سطح شده بودند انتخاب شدند. بعد از آنها خواستیم که درباره دو موضوع ا...

15 صفحه اول

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: Transactions of the Association for Computational Linguistics

سال: 2021

ISSN: ['2307-387X']

DOI: https://doi.org/10.1162/tacl_a_00424